随着自动组件比例越来越多的新兴车辆系统提供了最佳控制的机会,以减轻交通拥堵和提高效率。最近有兴趣将深入增强学习(DRL)应用于这些非线性动力学系统,以自动设计有效的控制策略。尽管DRL是无模型的概念优势,但研究通常仍依赖于对特定车辆系统的艰苦训练设置。这是对各种车辆和机动性系统有效分析的关键挑战。为此,本文贡献了一种简化的用于车辆微仿真的方法,并以最少的手动设计发现了高性能控制策略。提出了一种可变的代理,多任务方法,以优化车辆部分观察到的马尔可夫决策过程。该方法在混合自治交通系统上进行了实验验证,该系统是自动化的。在六种不同的开放或封闭交通系统的所有配置中都可以观察到经验改进,通常比人类驾驶基线的15-60%。该研究揭示了许多紧急行为类似于缓解波浪,交通信号传导和坡道计量。最后,对新兴行为进行了分析,以产生可解释的控制策略,这些控制策略已通过学习的控制策略进行了验证。
translated by 谷歌翻译
由于早期的工作和新算法的开发人员,追溯式,本文使用可达性分析来验证跟随算法的安全性,这是一种用于阻尼停止和转移流量波的控制器。通过我们的物理平台收集的超过1100英里的驾驶数据,我们通过将其与人类驾驶行为进行比较来验证我们的分析结果。跟随控制器已经证明以低速抑制停止和转向流量波,但之前对其相对安全的分析仅限于加速度的上下界限。为了在先前的分析上进行扩展,可以使用可达性分析来研究其最初测试的速度的安全性,并且还处于更高的速度。示出了两种具有不同标准的安全分析配方:基于距离和基于时间的距离。跟随基于距离的标准被认为是安全的。然而,仿真结果表明,追踪者不代表人类驱动程序 - 它在车辆后面太紧密,特别是人类将认为是不安全的。另一方面,在基于前沿的安全分析的情况下,跟随不再被认为是安全的。提出了一种修改的追踪,以满足基于时间的安全标准。拟议的追随者的仿真结果表明,其响应能够更好地代表人类驾驶员行为。
translated by 谷歌翻译
时间上解耦政策的层次结构提出了一种有希望的方法,可以在复杂的长期计划问题中实现结构化探索。为了完全实现这种方法,需要一种端到端的培训范式。然而,由于在层次结构中的目标分配和目标级别之间的相互作用,挑战,这些多级政策的培训已经有限。在本文中,我们将策略优化过程视为多智能agence过程。这使我们能够借鉴多代理RL的沟通与合作之间的联系,并展示了对整个政策培训绩效的子政策之间增加的合作的好处。通过修改目标函数和后续级别的更高级别政策,我们介绍了一种简单但有效的技术,可以通过修改目标函数和随后的渐变来诱导级别合作。关于各种模拟机器人和交通管制任务的实验结果表明,诱导合作导致更强大的表现,并提高了一套艰难的长时间地平任务的样本效率。我们还发现使用我们的方法训练的目标条件调节政策显示更好地转移到新任务,突出了我们在学习任务不可行的较低级别行为方面的方法的好处。视频和代码可在:https://sites.google.com/berkeley.edu/cooperative-hrl。
translated by 谷歌翻译
通过改善安全性,效率和移动性,自动车辆(AVS)的快速发展持有运输系统的巨大潜力。然而,通过AVS被采用的这些影响的进展尚不清楚。众多技术挑战是出于分析自治的部分采用:部分控制和观察,多车辆互动以及现实世界网络代表的纯粹场景的目标。本文研究了近期AV影响,研究了深度加强学习(RL)在低AV采用政权中克服了这些挑战的适用性。提出了一个模块化学习框架,它利用深rl来解决复杂的交通动态。模块组成用于捕获常见的交通现象(停止和转运交通拥堵,车道更改,交叉点)。在系统级速度方面,发现了学习的控制法则改善人类驾驶绩效,高达57%,只有4-7%的AVS。此外,在单线交通中,发现只有局部观察的小型神经网络控制规律消除了停止和转移的流量 - 超过所有已知的基于模型的控制器,以实现近乎最佳性能 - 并概括为OUT-分销交通密度。
translated by 谷歌翻译
The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.
translated by 谷歌翻译
分散的多基金会计划一直是机器人技术研究的重要领域。该领域中有趣且有影响力的应用是在未结构化的道路环境中分散的车辆协调。例如,在十字路口中,在没有中央协调员的情况下,在相交路径的多个车辆上解除多种车辆是有用的。我们从常识中学到的是,要使车辆浏览这种未建筑的环境,驾驶员必须理解并符合附近驾驶员观察到的隐式“社会礼节”。为了研究这种隐式驾驶协议,我们收集了伯克利DeepDrive无人机数据集。该数据集包含1)一组航空视频记录未结构化驾驶,2)图像和注释的集合来训练车辆检测模型,3)一个用于说明典型用法的开发脚本套件。我们认为,该数据集是研究人类驱动因素和次要兴趣的分散多种计划的主要兴趣,用于遥感环境中的计算机视觉。
translated by 谷歌翻译
主动感知和凹觉视觉是人类视觉系统的基础。虽然动脉凹视觉减少了在注视期间要处理的信息的量,但主动感知会将凝视方向转变为视野中最有前途的部分。我们提出了一种方法,以模仿人类和机器人使用中央摄像机探索场景,并以最少的凝视转移来识别周围环境中存在的物体。我们的方法基于三种关键方法。首先,我们采用现成的深度对象检测器,并在大量的常规图像数据集上进行了预训练,并将分类输出校准为foveateat图像的情况。其次,考虑了几种数据融合技术,对对象分类和相应的不确定性编码对象分类和相应的不确定性进行了依次更新。第三,下一个最好的目光固定点是基于信息理论指标确定的,旨在最大程度地减少语义图的总预期不确定性。与随机选择的下一个凝视转移相比,提出的方法可以使检测的F1分数增加2-3个百分点,以相同数量的凝视偏移,并减少三分之一,而三分之一则是所需的凝视转移数量以达到相似的性能。
translated by 谷歌翻译
在本文中,我们开发了一种物理知识的神经网络(PINN)模型,用于具有急剧干扰初始条件的抛物线问题。作为抛物线问题的一个示例,我们考虑具有点(高斯)源初始条件的对流 - 分散方程(ADE)。在$ d $维的ADE中,在初始条件衰减中的扰动随时间$ t $ as $ t^{ - d/2} $,这可能会在Pinn解决方案中造成较大的近似错误。 ADE溶液中的局部大梯度使该方程的残余效率低下的(PINN)拉丁高立方体采样(常见)。最后,抛物线方程的PINN解对损耗函数中的权重选择敏感。我们提出了一种归一化的ADE形式,其中溶液的初始扰动不会降低幅度,并证明该归一化显着降低了PINN近似误差。我们提出了与通过其他方法选择的权重相比,损耗函数中的权重标准更准确。最后,我们提出了一种自适应采样方案,该方案可显着减少相同数量的采样(残差)点的PINN溶液误差。我们证明了提出的PINN模型的前进,反向和向后ADE的准确性。
translated by 谷歌翻译
这项正在进行的工作考虑了在多助理系统中自主行驶领域的可达性的安全分析。我们为速度游戏进行差异游戏后的车辆的安全问题,并研究不同的建模策略如何产生非常不同的行为,而不管其他情况策略的有效性如何。鉴于现实生活驾驶场景的性质,我们提出了我们的制定的建模策略,该策略占代理人之间的微妙互动,并将其Hamiltonian结果与其他基线进行比较。我们的配方鼓励降低汉密尔顿 - 雅各比安全性分析的保守性,以便在导航期间提供更好的安全保障。
translated by 谷歌翻译
Covid-19的早期检测对于控制其扩散至关重要。已经提出了深度学习方法,以检测来自胸部CT图像的Covid-19的暗示迹象。但是,由于疾病的新颖性,注释的体积数据稀缺。在这里,我们提出了一种不需要大的注释数据集或反向化来估计卷积神经网络(CNN)的过滤器的方法。对于几个CT图像,用户在代表性正常和异常区域上绘制标记。该方法生成由一系列卷积层组成的特征提取器,其内核专用于增强与标记的区域,并且我们的CNN的决策层是支持向量机。由于我们无法控制CT图像采集,我们还提出了一种强度标准化方法。我们的方法可以在数据集中达到0.97美元和0.93美元的平均准确性和κ值,其中包含来自不同站点的117个CT图像,超越了所有场景的对应物。
translated by 谷歌翻译